3. Intervalles de confiance et tests d’ajustement.

1) Le calcul des paramètres statistiques de la série âge donne les résultats suivants :

Moyenne : 40.06

Ecart-type : 9.341113

Variance : 87.2564

La règle consiste à classer les observations suivant leurs valeurs par rapport à la moyenne plus ou moins l’écart-type et plus ou moins deux fois l’écart-type. Les résultats sont les suivants :

 

 

effectifs

rangs des observations

petites valeurs :

[21.3778, 30.7189 [

7

37 32 11 9 6 18 46

valeurs inférieurs

à la moyenne

[30.7189, 40.0600 [

24

7 15 30 49 29 50 48 4

3 5 13 16 40 42 22 5

2 4 5 41 3 17 24 34 21 36

valeurs supérieures

à la moyenne

[40.0600, 49.4011 [

13

38 20 23 39 19 47 44

27 26 12 33 28 14

grandes valeurs

[49.4011, 58.7422 [

3

1 8 10

très grandes valeurs

[58.7422, 68.0000 [

3

25 43 31

On constate l’absence de très petites valeurs.

2) La répartition suivant les classes données permet de calculer la densité :

 

centre

effectif

pourcentage

densité

[20, 30 [

25

6

12

0.0120

[30, 35 [

32.5

8

16

0.0320

[35, 40 [

37.5

13

26

0.0520

[40, 45 [

42.5

12

24

0.0480

[45, 60 [

52.5

8

16

0.0107

L’histogramme est donné ci-dessous :

 Les coefficients d’asymétrie et d’aplatissement sont cas = 0.289 , cap = 3.125.La valeur limite du coefficient d’asymétrie (0.534 pour n = 50) est supérieure en valeur absolue à la valeur observée. On peut donc examiner le coefficient d’aplatissement : la valeur observée appartient à l’intervalle [2.150, 3.990] donné par la table pour cinquante observations. Il n’y a donc pas de contradiction avec l’hypothèse d’une loi normale. L’histogramme paraît d’ailleurs relativement proche de la densité de la loi normale.

3) On peut contrôler l’hypothèse de normalité en effectuant un test d’ajustement du c2. Les classes considérées peuvent être les premières, mais les effectifs seront trop faibles. On considère donc les secondes.

Cl.

%

Probabilité

Condition

Contribution au X2

1

0.120

0.14075

7.04

0.15

2

0.160

0.15327

7.66

0.01

3

0.260

0.20342

10.17

0.79

4

0.240

0.20411

10.21

0.32

5

0.220

0.29846

14.92

1.03

Les conditions de convergence sont vérifiées. On en déduit :

X2 = 2.3014

La table statistique du c2 donne la valeur limite ci-dessous pour un risque de première espèce a = 5% et un degré de liberté égal à n = 2 ( = 5 –2 –1) :

xa2 = 5.99

On accepte donc l’hypothèse de la loi normale. On aurait pu aussi examiner la probabilité critique donnée par le logiciel :

P(X2 > 2.3014) = 0.3167

Cette probabilité critique est supérieure au risque de première espèce a = 0.05 et conduit évidemment à la même conclusion.

4) L’intervalle de confiance de l’âge moyen pour un niveau de confiance égal à 0.95 est :

[ 37.44, 42.68 ]

On sait que n S2 / s2 suit la loi du c2  de degré de liberté n = 49 ( = n – 1). Ce degré de liberté ne figure pas dans la table, et on choisit donc les valeurs pour le degré de liberté le plus proche (50). On en déduit :

P [ 32.4 < n S2 / s2 < 71.4 ]

 0.95

P [ 71.4 < s2 / n S2 < 32.4 ]

 0.95

P [n S2 / 71.4 < s2 < n S2 / 32.4]

 0.95

L’intervalle de confiance est la réalisation de l’intervalle précédent. On remplace donc S2 par sa valeur observée s2 = 87.2564. L’intervalle de confiance de la variance est donc :

[ 61.10, 134.65 ]

L’intervalle de confiance de la moyenne dépend peu de la normalité de la série. On peut donc considérer que l’âge moyen de la clientèle d’Euromarket est compris entre 37.44 et 42.68 ans. En ce qui concerne la variance, l’intervalle de confiance n’a de sens que si la loi est normale. Ayant accepté cette hypothèse, on peut considérer que la variance de l’âge de la clientèle d’Euromarket est compris entre 61.10 et 134.65.

Le niveau de confiance, choisi ici à 95%, ne concerne que l’intervalle de confiance : il suppose a priori que les hypothèses nécessaires à son calcul sont vérifiées. Cela implique que l’on n’est pas du tout sûr que la variance de l’âge soit comprise entre les valeurs données puisque, bien que la loi normale soit acceptée, cela ne signifie pas qu’elle soit vraie.